Linux 的僵尸进程

TODO: 待完善，结合 Golang 开启的子进程进行分析...

在 Linux 系统中，当用 ps 命令观察进程的执行状态时，经常看到某些进程的状态栏为 defunct，这就是所谓的 “僵尸” 进程。“僵尸” 进程是一个早已死亡的进程，但在进程表（processs table）中仍占了一个位置（slot）。

由于进程表的容量是有限的，所以，defunct 进程不仅占用系统的内存资源，影响系统的性能，而且如果其数目太多，还会导致系统瘫痪。

僵尸进程的产生原因

每个进程在进程表里都有一个进入点（entry），核心程序执行该进程时使用到的一切信息都存储在进入点。当用 ps 命令察看系统中的进程信息时，看到的就是进程表中的相关数据。

所以，当一个父进程以 fork() 系统调用建立一个新的子进程后，核心进程就会在进程表中给这个子进程分配一个进入点，然后将相关信息存储在该进入点所对应的进程表内。这些信息中有一项是其父进程的识别码。

而当这个子进程结束的时候（比如调用 exit 命令结束），其实他并没有真正的被销毁，而是留下一个称为僵尸进程（Zombie）的数据结构（系统调用 exit 的作用是使进程退出，但是也仅仅限于一个正常的进程变成了一个僵尸进程，并不能完全将其销毁）。

此时原来进程表中的数据会被该进程的退出码（exit code）、执行时所用的 CPU 时间等数据所取代，这些数据会一直保留到系统将它传递给它的父进程为止。由此可见，defunct 进程的出现时间是在子进程终止后，但是父进程尚未读取这些数据之前。

此时，该僵尸子进程已经放弃了几乎所有的内存空间，没有任何可执行代码，也不能被调度，仅仅在进程列表中保留一个位置，记载该进程的退出状态信息供其他进程收集，除此之外，僵尸进程不再占有任何存储空间。

他需要他的父进程来为他收尸，如果他的父进程没有安装 SIGCHLD 信号处理函数调用 wait() 或 waitpid() 等待子进程结束，也没有显式忽略该信号，那么它就一直保持僵尸状态，如果这时候父进程结束了，那么 init 进程会自动接手这个子进程，为他收尸，他还是能被清除掉的。但是如果父进程是一个循环，不会结束，那么子进程就会一直保持僵尸状态，这就是系统中为什么有时候会有很多的僵尸进程。

如何杀死僵尸进程

僵尸进程一旦出现之后，很难自己消亡，会一直存在下去，直至系统重启。虽然僵尸进程几乎不占系统资源，但是，这样下去，数量太多了之后，终究会给系统带来其他的影响。因此，如果一旦见到僵尸进程，我们就要将其杀掉。如何杀掉僵尸进程呢？

请注意：defunct 状态下的僵尸进程是不能直接使用 kill -9 命令杀掉的，否则就不叫僵尸进程了。那么，该如何杀呢？

方法有二：

重启服务器电脑，这个是最简单，最易用的方法，但是如果你服务器电脑上运行有其他的程序，那么这个方法，代价很大。所以，尽量使用下面一种方法。
找到该 defunct 僵尸进程的父进程，将该进程的父进程杀掉，则此 defunct 进程将自动消失。问题又来了，如何找到 defunct 僵尸进程的父进程呢？

很简单，一句命令就够了：

ps -ef | grep defunct_process_pid。

References

linux下的僵尸进程产生原因和解决方法（含具体代码）

僵尸进程的产生原因​

如何杀死僵尸进程​

References​

僵尸进程的产生原因

如何杀死僵尸进程

References